Generating Responses with a Specific Emotion in Dialog

0 Abstract

用强烈或含蓄的方式表达感情
有意义且结构连贯

1 Introduction

at least two ways to put feelings into words
两种表达感情的方法
one is to describe emotional states by explicitly using strong emotional words associated with the categories一种是显式的使用强烈的感情词语
another is to increase the intensify of the emotional experiences not by using words i emotion lexicon, bu ty implicitly combining neutral words in distinct ways on emotion.
另一种是含蓄地结合中性词汇表达情感
seq2seq框架，基于词典的注意力机制拓展，机制鼓励用情感词典中的同义词代替回复中的词
回复的生成过程由序列级的情感分类器指导，它帮助增强情感表达的强度，识别情感句子中是否包含情感词
半监督方法创建情感词典，相对准确地表示情感状态

2 3 Method

(1) seq2seq framework
(2) lexicon-based attention mechanism：plug in the desired emotional words 插入需要的情感词汇
(3) sequence-level emotion classifier：recognize the emotional sentences without any emotional word 识别没有情感词汇的情感句子
(4) diverse decoding algorithm: foster diversity in response generation 回复生成多样性
(5) semi-supervised method: produce an emotion lexicon that can properly represent the mental perceptions of the emotional states 产生一个情感词汇，能够恰当地表示对情感状态的心理感知

3.1 Problem Definition

输入：
post $X = {x_1,x_2,...,x_M}$
emotion category $e$
目标：
生成response $Y = {y_1, y_2,...,y_N}$ ，在意义和情感上都合适
其中 $x_i \in V$ 和$y_i \in V$分别是post和response中的词语
$M,N$分别是post和response的长度，
$V=V_g \cup V_e$是词典，包含了通用词典$V_g$和情感和一个情感词语$V_e$。$V_g \cap V_e = \emptyset$
$V_e$可以进一步分为几个子集$V^z_e$,每一个保存了有关情感分类$z$的词语。

3.2 Dialogue System with Lexicon-based Attention Mechanism 基于词典的注意力机制

基于seq2seq框架
lexicon-based attention mechanism: “plug” emotional words into the generated texts at the right time steps 在正确的时间步将情感词语插入到生成的文本中
encoder: 双向LSTM，将输入转化为向量表示
docoder: a separate LSTM enhanced with a lexicon-based attention mechanism 带基于lexicon的注意力机制的单个LSTM
输入：之前预测的词语$y_{j-1}$和情感向量$e_j$ 来更新隐状态；$y_{j-1}$的嵌入和$e_j$串接(concatenate)
情感向量$e_j$是对于给定的类别$z$, $V^z_e$中词语的加权和
（3）
对于$V^z_e$中的每个情感词语$w^z_k$来说，每个时间步$j$的注意力分数$a_{jk}$由三部分决定：

decoder的前一个隐藏状态$s_{j-1}$
输入post的编码表示$h_M$
$V^z_e$中第k个词的嵌入$Emb(w^z_k)$
3.3 Emotion Classification
sequence-level emotion classifier 序列级情感分类器，识别传递特定情感但不包含情感词语的回复
expected word embedding 期望词嵌入每个时间步所有可能的词的加权和

引入的情感分类器不仅能够增加情绪表达的强度，还可以识别情感回复中是否包含情感词语。情感分类器只用在训练过程中，可以作为情感表达的全局指导

3.4 Training Objective

由generation与classification 生成与分类两部分组成
生成损失$L_{MCE}$确保decoder可以产生结构连贯有意义的回复
分类损失$L_{CLA}$确保在产生的回复中特定情感可以合适的传达

3.5 Diverse Decoding Algorithm

集束搜索beam search生成的结果大多相似
强制开头的词语of N-candidates必须不同，然后在开头的词语确定后，继续用贪心解码策略生成回复。最后从最好的N个候选中选择感情分数最高的。

3.6 Emotion Lexicon Construction

如何用半监督方法从包含了句子和对应情感分类的语料库中建立需要的情感词典
The meaning of words is rated on a number of different bipolar adjective scales.单词的意思是用一些不同的双极性形容词量表来评定的。
对一个感情类别，每个词表示为$w=(p_w,n_w)$，其中$p_w$表示指定类别的概率，$n_w$表示另一个，即positiive和negative.
给定n个词组成的序列的句子s，
如果句子表示了情感，则标记为二维情感向量$z=(1,0)$，否则则标记为$z=(0,1)$.。每个词用一个小的随机值初始化，并最小化交叉熵___损失来训练，其中m是语料库中句子的数目。
移除所有的的停止词，映射识别的“digit数字”“E-mail电子邮件”“URL”“data日期”“foreign word外来词”到特殊符号。
跟在否定词后面的词在生成感情向量前被转化成 $(-p_w;-n_w)$
如果词语是最高级或比较级修饰的形容词或副词，更新表示时学习率的值会相应变为两倍或三倍
训练过程可以被分为两个阶段，第一阶段使用标准反向传播；当预测accuracy大于一个预定的阈值(如90%)时，进入第二阶段，开始使用maximum margin learning strategy，直到达到收敛。在训练结束时，计算平均值$v=\frac{1}{n}\sum^n_{i=1}(p_w-n_w)$以及方差$\sigma$值$\frac{1}{\sigma}(p_w-n_w-v)$大于特定阈值的词将会被视作情感词语。

4.Experiments

4.1 Data Preparation

目前没有现成的感情的对话数据，所以我们给予Short Text Conversation (STC)数据集建立了自己的实验数据集，我们首先在NLPCC数据集上训练出了一个情感分类器，然后使用这个分类器标注STC数据集。这个分类器使用Bi-LSTM.
NLPCC包含anger, disgust, contentment, joy, sadness, fear, surprise, neutral，移除不常见的类别fear和surprise，还剩六类，用bilstm分类器标注情感标签。训练、验证、测试集划分为9:0.5:0.5

4.2 Training Details

4.3 Baseline Models

Seq2Seq
EmoEmb
ECM
EmoDS-MLE
EmoDS-EV 使用外部情感词典，而不是内部的
EmoDS-BS 原始集束搜索beam search，而不是我们的多样化解码
4.4 Automatic Evaluation
Embedding Score
BLEU Score
Distinct
Emotion Evaluation
5 Conclusion
情感状态可以用语言来表达，可以明确地使用强烈的情感词，也可以用不同的模式形成中性词，我们提出了一个创新的情感对话系统，可以以任一方式传达想要的情感，并生成有意义且连贯的结构。
seq2seq框架用基于词典的注意力机制扩展，提高每个时间步中情感词进入文章的概率；情感分类器用于指导回复生成过程，确保特定的感情在生成文本中被合适的表达。